Projet de recherche

Mes travaux de recherche se situent à l’interface entre l’analyse en moyenne d’algorithmes et la bio-informatique. Ces travaux, allant de l’étude de problèmes sur les séquences à l’étude de systèmes biologiques, gardent un fil conducteur fort : quelles que soient les applications, l’objet d’étude central est une source probabiliste qui produit des mots. Ces travaux vont de l’étude de séquences (avec des applications bio-informatiques qui se concrétisent par la mise au point d’algorithmes dédiés de recherche de motifs et la définition de tests statistiques) à l’étude de systèmes biologiques (avec des développements qui ont été appliqués, en collaboration étroite avec des équipes de biologistes, à des modèles biologiques réels). Sur cette thématique, je collabore tant avec des équipes de biologistes (Institut du Thorax, CHU de Nantes; Station Biologique de Roscoff; Université de Santiago du Chili;…) que des équipes d’informaticiens (EPI DyLISS, IRISA ; MeForBio, IRCCyN;,…).

Mes contributions principales sur les cinq dernières années concernent les articles suivants:

J’ai mis au point un modèle probabiliste original, le graphe d'évènements de transition, qui est une abstraction (linéaire) de la dynamique (exponentielle) d'un système. L’intérêt de ce modèle est qu’il permet d’intégrer, via des résultats issus de l’analyse en moyenne d’algorithmes, des données quantitatives mesurées à l’échelle d’une population de cellules (par exemple des évolutions de concentration de protéines) dans une description qualitative des mécanismes décrivant de fonctionnement à l’échelle d’une cellule individuelle. Ce modèle a permis d’étudier le changement de phase de la bactérie E. Coli en privation de carbone, un système vivant servant de « benchmark » pour de nombreuses méthodes de modélisation. La thèse de Vincent Picard porte sur la poursuite des développements méthodologiques de ce modèle. En outre, les outils développés ont été appliqués à un modèle plus ambitieux, en collaboration avec des chercheurs biologistes de l’UMR Mer et Santé, Station Biologique de Roscoff, UPMC (projet PEPS CNRS (QuantOursin), 2010-2012 et l’ANR Biotempo 2010-2014).

Les résultats présentés dans cet article concernent la mise au point et le développement d’une méthode d’étude in silico de la répartition en carbone d’une entrée d’un réseau métabolique sur ses sorties. Ces travaux, purement méthodologiques trouvent des applications dans le domaine de la nutrition des grands ruminants. En collaboration avec Anne Siegel (Equipe-projet DyLISS, INRIA Rennes-Bretagne-Atlantique), j’ai mené une collaboration avec l'INRA Saint-Gilles sur l'étude du réseau métabolique de la glande mammaire de la vache qui s’est poursuivie par une thèse sur ce sujet à Rennes. Mes travaux autour de l’étude de réseaux métaboliques se poursuivent actuellement via l’encadrement de deux thèses (Marko Budinich et Hanen Mhamdi) et d’un post-doctorat (Yann Guitton) sur ces sujets.

Ce papier concerne une étude en probabilité d’un problème classique en recherche de motif. Dans cet article, nous proposons une approximation fine (propriété de grandes déviations) de la distribution du nombre d’occurrences d’un motif lorsqu’il est cherché sur les deux brins d’une séquence d’ADN.